Claude Code 最佳实践：Code Review 与 Test Time Compute | LLM Wiki

Built 26/04/15 21:42commit 9419fc3

中文 | English

Code Review 与 Test Time Compute —— Boris Cherny 的建议

这是 Boris Cherny（@bcherny）在 2026-03-10 分享的两条洞见总结。

1/ 引入 Code Review

Claude Code 新增了 Code Review：一组 agent 会对每个 PR 做深度审查。

这个能力最初是先为 Anthropic 自己的团队构建的。随着每位工程师的代码产出提高，review 成了瓶颈。
Boris 已经用了几周，结论是它能发现许多原本不会注意到的真实 bug。
当一个 PR 打开时，Claude 会派出多个 agent 去主动寻找问题。

2/ Test Time Compute 与多个上下文窗口

粗略来说，给编码问题投入的 token 越多，结果往往越好。Boris 把这称为 test time compute。

使用 彼此独立的上下文窗口 会让结果更好，这正是 subagents 有效的原因之一：一个 agent 可能制造 bug，另一个使用相同模型的 agent 却更容易把它找出来。
这和工程团队很像：如果 Boris 自己写出了 bug，他的同事在 review 时代码反而更容易发现它。
从极限上看，agent 也许终有一天会写出完美无 bug 的代码；在那之前，多个彼此不相关的上下文窗口 通常是更稳的做法。